Méthodes de mapping situées aux niveaux instance et schéma pour l'intégration de sources de données hétérogènes

نویسندگان

  • Fleur Mougin
  • Julie Chabalier
  • Olivier Bodenreider
  • Anita Burgun-Parenthoine
چکیده

Résumé : Un des obstacles principaux à l'intégration de sources de données est l’hétérogénéité des schémas des sources et en particulier la disparité des éléments de données (EDs) associés. Dans ce cadre, nous proposons des approches visant à intégrer les EDs de onze sources biomédicales. Tout d'abord, au niveau schéma, nous cherchons à mettre en correspondance les EDs avec des concepts d'une ressource terminologique biomédicale de référence : l'UMLS. En pratique, nous réalisons un mapping direct et un mapping via une ressource externe, WordNet. Nous proposons ensuite des méthodes au niveau instance en exploitant les valeurs associées aux EDs au sein des sources. Nous montrons en quoi le niveau instance permet de compléter les mappings obtenus au niveau schéma et nous soulignons son aspect essentiel pour considérer la sémantique des EDs.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Intégration de données hétérogènes basée sur la qualité

RÉSUMÉ. Les systèmes de médiation constituent une réponse architecturale pour un accès transparent à des sources de données distribuées. Cependant, leur mise en oeuvre pose un certain nombre de problèmes, tant en ce qui concerne la génération des liens sémantiques entre le schéma de médiation et les sources de données (requêtes de médiation) qu'en ce qui concerne l'adaptation de l'accès aux bes...

متن کامل

Vers l'intégration multidimensionnelle d'Open Data dans les entrepôts de données

Résumé. L’émergence de nombreuses sources d’Open Data poussent plusieurs communautés de recherche ainsi que des entreprises à développer des outils permettant leur exploitation. En particulier, les données statistiques présentes dans les Open Data peuvent constituer des informations utiles aux analyses décisionnelles. Toutefois les Open Data très hétérogènes et disséminés en plusieurs morceaux ...

متن کامل

Analyse OLAP d'un entrepôt de documents XML

RESUME. Les systèmes OLAP basés sur des entrepôts de données sont aujourd’hui bien intégrés dans les organisations, ils facilitent le traitement et l’analyse de l’information pour la prise de décision. Le développement du Web a conduit à l’accroissement du volume de données traité, ainsi qu’à la diversification des sources de l’information. Ce problème de diversification a été en partie résolu ...

متن کامل

Recherche de sous-structures fréquentes pour l'intégration de schémas XML

Résumé. La recherche d’un schéma médiateur à partir d’un ensemble de schémas XML est une problématique actuelle où les résultats de recherche issus de la fouille de données arborescentes peuvent être adoptés. Dans ce contexte, plusieurs propositions ont été réalisées mais les méthodes de représentation des arborescences sont souvent trop coûteuses pour permettre un véritable passage à l’échelle...

متن کامل

Evolution de modèle dans les entrepôts de données : existant et perspectives

Résumé. Un entrepôt de données permet d’intégrer des sources de données hétérogènes à des fins d’analyse. Un des points clés de la réussite du processus d’entreposage de données réside dans la définition du modèle de l’entrepôt en fonction des sources de données et des besoins d’analyse. Une fois l’entrepôt conçu, le contenu et la structure des sources de données, tout comme les besoins d’analy...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2007